Vers une annotation automatique de corpus audio pour la synthèse de parole (Towards Fully Automatic Annotation of Audio Books for Text-To-Speech (TTS) Synthesis) [in French]
نویسندگان
چکیده
RÉSUMÉ La construction de corpus de parole est une étape cruciale pour tout système de synthèse de la parole à partir du texte. L’usage de modèles statistiques nécessite aujourd’hui l’utilisation de corpus de très grande taille qui doivent être enregistrés, transcrits, annotés et segmentés afin d’être exploitables. La variété des corpus nécessaire aux applications actuelles (contenu, style, etc.) rend l’utilisation de ressources audio disponibles, comme les livres audio, très attrayante. C’est dans ce cadre que s’inscrit notre proposition de chaîne d’acquisition, de segmentation, et d’annotation de livres audio. Cette proposition tend vers la mise en place d’un processus automatique. Le processus proposé s’appuie sur une structure de données, ROOTS, qui établit des relations entre différents niveaux d’annotation. Cette méthodologie a été appliquée avec succès sur 11 heures de parole extraites d’un livre audio. Une vérification manuelle sur une partie du corpus annoté a montré l’efficacité du procédé. ABSTRACT Towards Fully Automatic Annotation of Audio Books for Text-To-Speech (TTS) Synthesis
منابع مشابه
Contribution à l'étude de la variabilité de la voix des personnes âgées en reconnaissance automatique de la parole (Contribution to the study of elderly people's voice variability in automatic speech recognition) [in French]
RÉSUMÉ L’utilisation de la reconnaissance vocale pour l’assistance à la vie autonome se heurte à la difficulté d’utilisation des systèmes de RAP qui ne sont pas prévus à la base pour la voix âgée. Pour caractériser les différences de comportement d’un système de reconnaissance entre les personnes âgées et non-âgées, nous avons étudié quels sont les phonèmes les moins bien reconnus en nous basan...
متن کاملAutomatic identification of document sections for designing a French clinical corpus (Identification automatique de zones dans des documents pour la constitution d'un corpus médical en français) [in French]
Résumé. De nombreuses informations cliniques sont contenues dans le texte des dossiers électroniques de patients et ne sont pas directement accessibles à des fins de traitement automatique. Pour pallier cela, nous préparons un large corpus annoté de documents cliniques. Une première étape de ce travail consiste à séparer le contenu médical des documents et les informations administratives conte...
متن کاملTowards Fully Automatic Annotation of Audio Books for TTS
Building speech corpora is a first and crucial step for every text-to-speech synthesis system. Nowadays, the use of statistical models implies the use of huge sized corpora that need to be recorded, transcribed, annotated and segmented to be usable. The variety of corpora necessary for recent applications (content, style, etc.) makes the use of existing digital audio resources very attractive. ...
متن کاملRelevance of ASR for the Automatic Generation of Keywords Suggestions for TV programs
Résumé. L’accès aux documents multimédia, dans une archive audiovisuelle, dépend en grande partie de la quantité et de la qualité des métadonnées attachées aux documents, notamment la description de leur contenu. Cependant, l’annotation manuelle des collections est astreignante pour le personnel. De nombreuses archives évoluent vers des méthodes d’annotation (semi-)automatiques pour la création...
متن کاملTowards automatic cross-lingual transfer of semantic annotation
In order to develop a semantic labeling system, the most common methods use supervised learning from an annotated corpus. What if we have short deadlines and limited human and financial possibilities that prevent us from building such a training corpus for our language? If such a corpus already exists for any other language, this paper proposes a method to automatically import the existing corp...
متن کامل